数组下标-1你见过吗?
来源:公众号【编程珠玑】
作者:守望先生
ID:shouwangxiansheng
不知道你有没有见过-1作为数组下标的,我算是见到了。当然这一点在Python之类的语言中毫不稀奇。
下标-1的代码
这里redis源码中的一部分:
sds sdsMakeRoomFor(sds s, size_t addlen) {
void *sh, *newsh;
size_t avail = sdsavail(s);
size_t len, newlen;
char type, oldtype = s[-1] & SDS_TYPE_MASK;
int hdrlen;
//摘取部分代码
其中sds定义如下:
typedef char* sds
我们忽略其中的逻辑,其实可以看到在sds中有很多使用-1作为下标的。那么这里到底有什么含义?又有什么好处呢?别急!
数组下标访问
我们都知道,数组下标可以以O(1)复杂度访问一个数组的元素:
int arr[] = {1,2,3,4,5};
printf("%d\n",arr[2]);
上面的示例代码中,就是访问了数组的第三个元素,实际上,作用等价于;
printf("%d\n",*(arr+2));
这一点,我已经在《C语言入坑指南-数组之谜》中解释过了。arr相当于int*类型指针,+2,意味着指针向前移动了sizeof(int) * 2,即8字节的位置,最终指向数字3。关于指针的算术运算,也可以参考《void*是怎样的存在》。
再看下面:
int *pArr = arr + 2;
printf("%d\n",pArr[-1]);//printf("%d\n",*(pArr-1))
这里也很好理解,无非就是pArr指向数字3,然后又使用下标-1,访问了前一个位置,最终自然指向了数字2,打印的也是2。
到目前为止,一切都还合情合理。
但是,我们别忘了,数组越界是一件很可怕事情。比如,你试试:
printf("%d\n",arr[16]);
printf("%d\n",arr[-1]);
运气不好的时候,程序不会挂死,只是打印出一些莫名其妙的值,运气好的时候,程序挂死。(有人可能会问,为什么程序不会挂死,运气还算好呢?因为不挂死的时候,一些隐藏的问题更让人抓狂)。
到这里我们明白了,为了数组下标访问不越界,通常下标范围是0~size-1,其中size是数组元素个数。
那么问题来了,redis的源码中为什么要用-1作为下标呢?
巧妙的-1
实际上,sds其中的一个结构(8bit范围长度)定义是这样的:
struct __attribute__ ((__packed__)) sdshdr8 {
uint8_t len; /* used */
uint8_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
其中
__attribute__ ((__packed__))
是取消字节对齐,关于字节对齐,可以参考《理一理字节对齐的那些事》,本文不再赘述。
而在每一次创建新的sds结构的时候,返回的指针,都是指向buf这里从源码的sdsnewlen函数中很容易看出:
即:
1字节 | 1字节 | 1字节 | |
---|---|---|---|
len | alloc | flags | buf |
↑ |
所以我们看到前面这样的代码也就不足为奇了:
oldtype = s[-1] & SDS_TYPE_MASK;
这里的-1相当于将指针指向了flags字段:
1字节 | 1字节 | 1字节 | |
---|---|---|---|
len | alloc | flags | buf |
↑ |
相信到这里你应该能理解-1的作用了。
那么为什么要这么做呢?想象一下,使用strlen是不是直接可以计算sds字符串的长度了呢?
总结
一般来说-1这样的用法是不太建议的,或者说,在使用下标访问数组时,必须确保不越界。
预告
redis中为什么不用普通的char*存储字符串,而要使用所谓的简单动态字符串?背后究竟隐藏着怎样的秘密?请看下文详细分解。
相关精彩推荐
关注公众号【编程珠玑】,获取更多Linux/C/C++/数据结构与算法/计算机基础/工具等原创技术文章。后台免费获取经典电子书和视频资源
文章有帮助?不妨右下角点个在看?